草庐IT

postgresql - hadoop——大型数据库查询

全部标签

ruby-on-rails - 将大型 Rails 应用程序分解成较小的应用程序?

按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visitthehelpcenter指导。关闭10年前。我有一个包含600个模型的Rails应用程序,很快就会增加到800-1000个。我想对Rails应用程序进行分段,以便仅加载某些模型,因此充当单独的应用程序,但所有模型都共享相同的基本模型。是否有执行此操作的标准做法?编辑:我在2.3.8编辑2:问题是许多模型是相似的,但不同之处恰恰足以保证编写一个新类,也就是说,将所有模型都放在一个模型中所需的逻辑将是

ruby-on-rails - 如何使用 ruby​​ 加速大型 CSV 的处理

对于一个项目,我需要解析一些非常大的CSV文件。一些条目的内容存储在MySQL数据库中。我正在尝试使用多线程来加快速度,但到目前为止,这只会减慢速度。我解析了一个CSV文件(最大10GB),其中一些记录(20M+记录CSV中的大约5M)需要插入到MySQL数据库中。为了确定需要插入的记录,我们使用Redis服务器和包含正确ID/引用的集合。由于我们在任何给定时间处理大约30个这样的文件,并且存在一些依赖关系,我们将每个文件存储在一个Resque队列中,并让多个服务器处理这些(优先级)队列。简而言之:classWorkerdefself.perform(file)CsvParser.ea

ruby-on-rails - 使用 Gerrit 部署 Ruby on Rails 数据库

我正在考虑在我的下一个项目中使用RubyonRails。了解Rails网站的部署很容易理解(听起来我会使用PhusionPassenger)但现在我正试图找出数据库。我看到很多关于“数据库迁移”的内容,它允许我使用ruby​​代码更新数据库。我还看到我被允许创建这些迁移的up和down变体。但是,我只能理解这是如何在一个方向上干净利落地工作的。想象一下,如果我突然说“颜色列不能为空”。因此,up将使其成为必需项并为所有NULL条目提供默认值。但是向下会做什么呢?如果您关心它与它的开始方式相同,则不能将默认值设置回NULL。这对于发布到生产环境来说并不重要。这可能只会在一个方向上完成(在

ruby-on-rails - 使用 API 获取数据时,最好将该数据存储在另一个数据库中,还是最好在需要时继续获取该数据?

这个问题在这里已经有了答案:CachingcallstoanexternalAPIinarailsapp(1个回答)关闭6年前。我正在使用TMDBapi来获取电影标题和发行年份等信息,但我想知道我是否需要创建一个额外的数据库来在本地存储所有这些信息,而不是继续使用api获取信息?例如,我是否应该创建一个电影模型并调用:film.title并通过这样做访问存储有标题的本地数据库,或者我调用:Tmdb::Movie.detail(550).title然后再调用一次api?

ruby-on-rails - rake 数据库 :migrate not working on my postgres db

好的,所以我有一个Rails应用程序,我试图在postgres数据库上运行迁移,我通常使用mysql,一切都很好,但是当我运行命令时,我得到了这个rakedb:migrate(in/Users/tamer/Sites/my_app)/Users/tamer/.rvm/gems/ruby-1.9.2-p290@my_app/gems/activerecord-3.0.3/lib/active_record/connection_adapters/postgresql_adapter.rb:487:[BUG]Segmentationfaultruby1.9.2p290(2011-07-09

sql - 来自 ActiveRecord::Base.connection.execute(sql) - PostgreSQL 的结果

在使用ActiveRecord::BaseConnection类执行SQL语句后,如何找到PostgreSQL处理的记录数?temp_sql="UPDATEtable_aSETcolumn_a='abc'WHEREcolumn_b=1"result=ActiveRecord::Base.establish_connection(@db).connection.execute(temp_sql)或者您可以建议更好的方法来做到这一点。请记住,上面的更新声明是一个简单的更新声明,以保持问题简短。我真正的查询是“基于集合”的,涉及复杂的创建临时表、更新、插入语句。

ruby-on-rails - 我如何解析一个 Excel 文件,它会给我提供与视觉上完全一样的数据?

我正在使用Rails5(Ruby2.4)。我想阅读.xls文档,我想将数据转换为CSV格式,就像它出现在Excel文件中一样。有人推荐我使用Roo,所以我有book=Roo::Spreadsheet.open(file_location)sheet=book.sheet(0)text=sheet.to_csvarr_of_arrs=CSV.parse(text)但是,返回的内容与我在电子表格中看到的内容不同。例如,电子表格中的一个单元格有16:45.81当我从上面获取CSV数据时,返回的是"0.011641319444444444"如何解析Excel文档并准确获取我所看到的内容?我不在

ruby - 为 PostgreSQL 8.3 安装 PL/Ruby

这是为了能够使用嵌入的ruby代码开发postgres函数,但我一直无法构建它。根据建议http://www.robbyonrails.com/articles/2005/08/22/installing-untrusted-pl-ruby-for-postgresql我正在尝试从ftp://moulon.inra.fr/pub/ruby/提供的最新版本(plruby-0.5.3.tar.gz)构建所需的plruby.so我已经弄清楚我的本地postgres设置在哪里,并将调用调整为:rubyextconf.rb--with-pgsql-include=/usr/postgresql-

ruby-on-rails - 我应该将我的数据库查询测试放在 Rails 中的什么位置?

我来自Spring/hibernate背景。我注意到Rails没有dao和服务层。这确实加快了开发速度,但有时我不知道将测试放在哪里。现在,我一直在将我的模型方法和验证测试放在主要模型规范中。这个文件已经相当大了。测试查询的“标准”位置在哪里?我可以想象自己制作了大量固定装置/虚拟数据以确保我的查询按预期工作(可能是一个更好的主意,因为我是Rails的新手)。这些对于基本模型逻辑和验证测试来说并不是真正需要的。如果您能提供一些关于将这些测试放在哪里的建议,使用rails测试查询的最佳方法(尤其是具有多个连接的查询!),也许还有一些基本准则,说明它与使用DBunit/spring进行测试

ruby - 在 Ruby 中漂亮地打印树数据结构

我正在构建一个编译器,并在其中生成一棵树来表示传入的源程序。我想展示这是一棵时尚的树,以便我可以向任何感兴趣的人展示程序的结构.现在我只是像这样在一行中打印树:ProgramNode->'Math'BlockNode->DeclarationNode->ConstantDeclarationNode->constConstantListNode->[m:=7,ConstantANode->[n:=StringLiteralNode->""TEST""]];我想要的是这样的:ProgramNode/\'Math'BlockNode|DeclarationNode|ConstantDecl